其實應該先解釋 confusion matrix, 但是這是速成班, 下週再找日期來補.
從線性迴歸跟類別型兩大類來看Metrics / 評估指標.
MSE, RMSE, R-squared
MAE
(R)MSPE, MAPE
(R)MSLE
Accuracy, LogLoss, AUC
Cohen's (Quadratic weighted) Kappa
optimal constant : target mean
均方誤差 (MSE) 是最常用的回歸損失函數,計算方法是求預測值與真實值之間距離的平方和. 由於有平方, 懲罰偏離真實比較重, 因此適合梯度計算. 在數學又稱 L2 損失, MSE 可以評價資料的變化程度,MSE 的值越小,說明預測模型描述實驗資料具有更好的精確度。
因為 MSE 跟 RMSE 方向一致, MSE(A) > MSE (B)則 RMSE(A) > RMSE (B), 因此若比賽是要用 RMSE 做評估指標, 那 model 就可用比較容易的 MSE, 效果一樣
就是我們統計上在用的 R-squared
常用在財務方面, 在數學又稱 L1 損失, MAE 就是將每次測量的絕對誤差取絕對值後求的平均值, 用來觀察預測值誤差的測量是否要調整。
optimal constant : target median
MSPE best constant : weighted target mean
MAPE best constant : weighted target median
Best constant : mean target value